Automatische Extraktion von Fachterminologie aus kunst-historischen Volltexten

نویسنده

  • Juliane Bredack
چکیده

Mit Hilfe eines algorithmisch arbeitenden Verfahrens können fachterminologische Mehrwortgruppen aus elektronisch vorliegenden Texten identifiziert und extrahiert werden. Inhaltlicher Schwerpunkt stellt die Einbindung von Funktionswörtern des deutschen Sprachgebrauchs in den Extraktionsalgorithmus dar. Als Datengrundlage dieser Arbeit dienten kunsthistorische Lexikonartikel des Reallexikons zur Deutschen Kunstgeschichte. Das automatische Indexierungssystem Lingo wurde in dieser Studie genutzt. Anhand selbst gebildeter Kriterien, wurden die extrahierten Mehrwortgruppen qualitativ analysiert. Es konnte festgestellt werden, dass die Verwendung von Funktionswörtern fachterminologische Mehrwortgruppen erzeugt, die als potentielle Indexterme weitere Verwendung im Information Retrieval finden können.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Density-based clustering in large databases using projections and visualizations

Die Datenmengen, die in Computersystemen gespeichert werden, wachsen in aktuellen Anwendungsszenarien mit unvermindert großer Geschwindigkeit. Weil die Kapazität von Analysten begrenzt ist, sind automatische Methoden zur Extraktion von nützlichem Wissen aus großen Datenbanken sehr gefragt. Im Forschungsgebiet Data Mining ist diese Fragestellung ein Kernproblem und es wurden und werden viele ver...

متن کامل

Verbesserte Visualisierung der Koronararterien in MSCT-Daten mit direkter Vergleichbarkeit zur Angiographie

Kurzfassung. In diesem Beitrag stellen wir neue, automatisierte Verfahren zur Visualisierung der Koronararterien einerseits und für eine direkte Vergleichbarkeit mit konventionellen Angiogrammen andererseits vor. Unser Ansatz umfasst Methoden für die automatische Extraktion des Herzens aus kontrastverstärkten CT-Daten, sowie für die Maskierung grosser kontrastmittelgefüllter Kavitäten des Herze...

متن کامل

mArachna: Entwicklung von Wissensrepräsentationsmechanismen für die Mathematik

Die automatische Extraktion von Wissen aus natürlichsprachlichen Texten ist eine große technische Herausforderung, die – betrachtet man die Gesamtheit aller möglichen schriftlichen Quellen – heute noch als weitgehend ungelöst gelten muss. Wissenschaftliche und insbesondere mathematische Texte zeichnen sich jedoch durch einen höheren Grad der Strukturiertheit aus, und sie verfolgen stets das Zie...

متن کامل

Automatische Segmentierung der zerebralen Gefäße aus 3D-TOF-MRA-Bildsequenzen mittels Fuzzy-Methoden

Kurzfassung. Im Rahmen dieses Beitrages wird eine automatische Methode zur Extraktion des zerebralen Gefäßsystems aus 3D-Time-of-Flight (TOF)-MRA-Bildsequenzen vorgestellt. Hierbei wird zunächst in einem Vorverarbeitungsschritt das Gehirn von den nicht-zerebralen Gewebeklassen befreit. In einem weiteren Schritt wird aus dem TOF-Datensatz ein Vesselnessund Maximum-Parameterbild berechnet. Diese ...

متن کامل

Semiautomatische Konstruktion von Trainingsdaten für die Suche in historischen Dokumenten

Für Retrieval in historischen Dokumenten wird eine Abbildung der Suchbegriffe auf die historischen Varianten in den Dokumenten benötigt. Für diese Abbildung wurde ein regelbasierter Ansatz entwickelt. Der Engpass dieses Ansatzes ist die Konstruktion der Trainingsdaten. Dabei muss ein Experte manuell den historischen Formen, die dem Spellchecker unbekannt sind, die aktuelle moderne Form zuordnen...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014